Saber Preguntar: Clarificación Autogestionada en Agentes Jerárquicos
Un nuevo método permite a los agentes de IA decidir cuándo pedir clarificación, aumentando hasta 16% la exactitud en taxonomías de 30,000 nodos.
Un nuevo método permite a los agentes de IA decidir cuándo pedir clarificación, aumentando hasta 16% la exactitud en taxonomías de 30,000 nodos.
La oclusión demuestra que la geometría potencia la memoria espacial en agentes de lenguaje. Estudio revela mejora del 32% frente al enfoque lineal. ¡Lee más!
El nuevo marco OSL-MR optimiza la retención de memoria en agentes de lenguaje, superando heurísticas y mejorando precisión con presupuestos ajustados.
El Agente Árbitro monitoriza conversaciones multi-agente para detectar desalineaciones emergentes con presupuesto limitado. Mejora la seguridad.
AdaMEM: memoria adaptativa durante la inferencia para agentes de lenguaje. Mejora rendimiento hasta 13% en tareas complejas. ¡Descúbrelo!
Aprende cómo la calibración por contexto y la entropía mejoran la detección de riesgos en agentes LLM frente a hackeos de recompensa.
ArcANE evalúa si los agentes de rol mantienen la coherencia psicológica según el arco narrativo, en situaciones nuevas. Mejora tus modelos con este benchmark.
SGDR revoluciona el aprendizaje de habilidades en agentes web: recuperación dinámica basada en estado mejora un 10% la tasa de éxito en WebArena. ¡Conoce los detalles!
RGMem: memoria evolutiva multiescala para agentes conversacionales. Aprende de interacciones pasadas, se adapta a preferencias y supera límites de contexto.
PieArena mide la capacidad de negociación de los LLMs en escenarios reales. GPT-5 iguala o supera a humanos en este benchmark.
Descubre PaW: co-entrenamiento de políticas y modelado del mundo para agentes de lenguaje. Mejora el aprendizaje por refuerzo sin modificar la inferencia.
Descubre AGENTCL, un marco para evaluar cómo los agentes de IA acumulan experiencia y mejoran en tareas. Aprende sobre transferencia de aprendizaje y diseño de memoria.
Evaluamos la direccionalidad a objetivos en agentes de lenguaje con análisis conductual y representacional. Descubre cómo entender su comportamiento.